查看原文
其他

暑期专题 | 科研入门(工具篇),刘润清先生谈统计软件

数据统计与分析一直是许多外语教师在科研中最为头疼的部分。今天我们为大家准备了两颗小药丸,一是刘润清先生为您介绍统计中的一些辅助软件和工具;二是为企盼科研入门的各位外语教师度身打造的“统计方法与数据分析”研修班,结合实例,为您详细讲解外语教学研究中常用统计方法的基本原理以及统计工具SPSS的基本操作,包括统计基础知识、各种参数检验方法(如:T检验、相关分析、回归分析)和非参数检验方法(如:卡方检验)。既“授之以鱼”,亦“授之以渔”,祝您学有所获!

《外语教学中的科研方法》(修订版)连载四,本文节选自该书第十一章第二节

一、定性数据分析

本节着重介绍机助定性数据处理的软件(computer-assisted qualitative data analysis software, CAQDAS)。这里介绍的统计软件引自麦基和盖苏珊(Alison Mackey & Susan M. Gass)合作主编的Research Methods in Second Language Acquisition: A Practical Guide(《二语习得中的科研方法:实用指南》)。

现在有不少机助软件供二语教学研究者选择,而且都提供免费在线辅导,一步一步引导你如何使用。有的软件比较昂贵,有的有学生价,都有免费试用期。有人说,到目前为止,NVivo是二语教学科研中使用最广泛的软件。英国萨里大学(Surrey University)的CAQDAS Networking Project 网站为老师们提供没有偏见的软件介绍(请登录:http://caqdas.soc.surrey.ac.uk)。定性数据繁杂、量大,令研究者头疼不已,而机助软件能够大大地减轻研究者的负担。下面介绍的统计软件网站,我都试了试,除了一个我没能登录,其他都上去了,还下载了几个免费试用软件。人家通常还立刻回信。

使用机助定性数据处理的软件(CAQDAS)有许多优点。第一,有利于数据管理。定性数据常常涉及成吨的材料,有数码的,有纸质的,还有录音、视频、图表等,能把研究者搞得头晕目眩。而CAQDAS则能很容易地帮你管理所有这些材料。例如,软件NVivo(和其他任何软件)能在电脑屏幕上显示一切文章、记录、笔记、视频资料、备忘录、荧光笔痕迹等。

第二,CAQDAS能使研究者与在场的各种形式的数据互动,这是因为这类软件能储存并支持各种形式的数据,包括各种音频(.mp3,.wma,.wav files)、视频(.mpg,.wmv,.qt,.mp4),以及其他传媒形式的材料。所以,一切材料“同居一室”,使不同形式的数据之间共同进行编码成为可能。例如,研究者可以同时打开项目日志、一个视频和视频的文字转写,在三者之间随便游走。这就免去在桌子上摆着各种材料(纸质文件、数码录音机、数码相机、视频放像机、电视机、日志本等)的烦恼。

第三,CAQDAS有自动搜索功能,就像在线搜索引擎一样。如果你想查阅词、句子、段落,甚至不同语言之间的各类形式,搜索工具都能瞬间完成。这些事若靠手工来做,少不了要花上几个小时。此外,CAQDAS还能搜查编码,这能使研究者搜查同一编码在不同受试者身上有何表现。点击某一编码可以显示标着该编码的所有文字段落或各种类型的数据版本。这很重要,因为在定性数据编码中,往往一个编码用于多个思想范畴,或同一范畴出现了不同编码。例如,许多地方都编了“学习外语的理由”,用软件搜索之后,你会发现这些理由有大有小,可以细化出一个等级系统。所以,它们对范畴细化和编码等级化等都十分必要。况且,这些软件都支持在搜索时运用“布尔逻辑”(Boolean logic),也叫“是或非”逻辑(就是同真为真,一假为假;或运算就是一真为真,全假为假!真的非运算是假,假的非运算是真),即运用“和”(AND)、“或”(OR)、“否”(NOT)连接关系帮助搜索。

定性数据分析软件介绍

软件名称

网址

编码描写

优点

ATLAS.ti

http://www.atlasti.com

编码结构不分等级;非编码数据也可提取,叫“独立引用”

可支持多种文件,包括“谷歌地球”的TMkmz文件;能通过网络建立和显示不同编码之间的联系

Hyper-RESEARCH

http://www.researchware.com

有编码器进行编码,研究者可添加或编辑编码,或用下拉菜单

与Mac匹配;允许研究者创建编码地图,借以呈现编码之间的联系;有工具帮助建立假设,研究者可定义其逻辑关系

Ethnograph

http://www.qualisresearch.com

研究者涂亮部分文本即可加编码;编码频率自动生成

有图示呈现;如所有备忘录都会标上m显示出来;价格合理

MAXQDA

http://www.maxqda.com

有drop-down和drag-and-drop菜单做编码;编码还能显示代表性程度

可用不同颜色标出不同编码和文本特性,使编码过程更有可视性

NVivo

http://www.qsrinternational.com

编码选择系统,包括自由节点,9层树形节点,还有关系、分类、矩阵;注释和相互联系的备忘录帮助编码和记录

搜寻工具先进;搜索数据、节点、备忘录等时的询问能力强;备有模型和图表工具,所以图示显现能力强

Qualrus

http://www.ideaworks.com

研究者组织材料和决定编码时,可以把材料构件堆成“虚拟笔记卡片”,方便编码

有编码智能,在编码过程中,可以为研究者提出范畴建议

(注:以上软件,除了HyperRESEARCH外,都能在Windows的机器上使用。使用Mac苹果机的,安装一个软件即可运转CAQDAS软件。例如,Apple’s Boot Camp允许Intel Mac下载Windows软件。)

二、t-检验

t-检验是用来比较不同数据的平均数的,看它们之间的差异是随机差异还是本质上的差异。t-检验又分独立样本t-检验、配对样本t-检验和单样本t-检验。进行什么样本的t-检验,要视研究目的和具体情况而定。如果比较两个不同样本(即独立样本)在某个变量上的差异,就使用独立样本t-检验;如果要比较同一个样本在两个变量上的差异,就使用配对样本t-检验;如果比较的是一个样本的平均值与某个指定的值,就使用单样本t-检验。

t-检验都用到样本的平均数及标准差。例如,独立样本t值就等于两组的平均值差除以平均值差的标准差。而且还要具备两个(假设)前提条件:两个总体都呈正态分布;两个总体具有相同的方差。配对样本t-检验是对同一总体的两个样本的比较,如比较同一组受试在实验条件下和在控制条件下的结果,这时的比较条件是:数据位定距或定比数据;每组的观察是在相同条件下进行的;平均值为正态分布。单样本t-检验则是检验一个样本的平均值是否来自已知平均值的总体,比如用它来检验一个班的平均英语成绩与全校的平均成绩之间是否存在显著差异。这也就是检验一个变量的平均值是与一个给定的常数相同或相异。

我们不具体介绍如何计算。下面给出三个网址,读者可以登录查看如何使用现成软件教学t-检验。

网址

输入数据

t-检验类型

网址另外提供什么

http://www.graphpad.com/quickcalcs/ttest1.cfm

单独输入;小结式输入(平均值,标准差,样本人数)

独立样本检验;配对样本检验;韦尔克(Welch)的非配对检验

平均值之间的区别;置信水平;t值;自由度

http://studenttest.com

单独输入数据

独立样本=方差相等或不相等的组;配对样本

提供单尾和双尾选择(不知道时,请用双尾)

http://facalty.Vassar.edu/lowry/ VassarStar.html

然后选靠左手边的“t-Test & Procedure”,点击第一选项

分栏输入数据(输入每个数据后按tab键)

独立——按“独立样本”键;配对样本——按“相关样本”键

平均数的差异和该差异的置信水平;t值;自由度

报告t-检验的结果时,要报告各组的平均分和标准差、每组的人数、P值、t-统计值和自由度。下面是一份设想的t-检验报告:

组别

平均值(50分满分)

标准差

人数

P值

t-统计值

自由度

控制组

37.0

5.2

24

0.07

1.84

44.7(用了韦尔克调整)

实验组

34.0

6.2

报告中常常用到“效果量”(effect size)的数据(参见“元分析”一节)。t-检验及其他检验中常会用到“效果量”。常用的测验之一是科恩效果量d值(Cohen’s d,即两组平均值之差除以标准差)。请你登录下面两个网站:

http://www.uccs.edu/~faculty/becker

http://www.cognitive.exibility.org/effectsize

然后输入两组的平均分和标准差,即可得到科恩d值(d值计算公式:两个平均值的差除以标准差)。d值效应的解释为:d=0.4为太小,d=0.7属中等,d=1.0时就算大了。上面设想的例子中,d值为1.05,说明两组的平均分之差大于一个标准差,属于差异较大了。报告中就写“独立样本t-检验发现,两组之间没有显著差异,t值(44.7)=1.84,P值=0.7,但是科恩效果量d值比较大(d=1.05)。”有理由认为实验组(M=37.0, SD=5.2)的成绩好于控制组(M=34.0, SD=6.0)。不过,这个样本太小,不能得出最后结论,建议用更大的样本来增加t-检验的力度。

由于篇幅所限,我们仅摘录了书中的小小一隅。更多统计软件、工具介绍,请参见原书。

【声明】感谢刘润清教授授权iResearch转载此文。其他公众账号如有转载需求,请注明该文原始出处:iResearch微信公众平台。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存